home *** CD-ROM | disk | FTP | other *** search
/ Mac Mania 2 / MacMania 2.toast / Demo's / Tools&Utilities / PowerPC / PPC News 1039 < prev    next >
Encoding:
Text File  |  1994-05-03  |  8.7 KB  |  177 lines  |  [TEXT/ERIC]

  1. POWERPC 604: A LOOK UNDER THE HOOD. AND A LOOK AT THE FUTURE
  2.  
  3. (April 29) Initial reaction to the PowerPC 604 has been extremely
  4. favourable and as always when a new chip is launched, the world made
  5. a bee-line for Michael Slater, editorial director of the Microprocessor
  6. Report, for his view. The Report's lead headline last week was "PPC
  7. 604 Powers Past Pentium - PowerPC Chip Will Open Performance Gap,
  8. Possibly Permanently". We guess he thinks the 604 is OK. Not only
  9. does the 604 leave announced Pentia in the dust, but IBM and Motorola
  10. believe that it will give the forthcoming P6 a run for its money.
  11. Additionally, there are plans to make the 604 and the 603 smaller by
  12. incorporating a fifth layer of metal, but more of that later.
  13.  
  14. There are now nearly 400 engineers working at the Somerset design
  15. facility and when their latest meisterwerk was launched last week, it
  16. was accompanied by a wealth of technical detail which in some measure
  17. goes to explain how the chip achieves its performance boost. However
  18. there are a few intriguing holes, which as we went to press still
  19. had to be filled. For example, the processor apparently plays host to
  20. some new graphics operations, which were not included in the 601. One
  21. IBM source suggests that these won't be supported by any general
  22. purpose compiler, but will be used by some graphic-intensive libraries.
  23.  
  24. In general, this is what we do know: the 604 has six functional
  25. units: a floating point unit; a branch processing unit; a
  26. load/store unit; two standard integer units and one multiple-cycle
  27. integer unit, used for the rarer division and multiplication
  28. requirements. The chip tries to dispatch up to four instructions on
  29. each clock cycle. It has a 64bit external data bus and a 32-bit address
  30. bus. In general, the capabilities are closer to the PowerPC 603 than
  31. the 601. The Load/Store unit debuted in the 603, for example and the
  32. 603 and 604 share a register renaming capability not present in the
  33. earlier chip.
  34.  
  35. Where the 603 and 604 differ, however is in size; where the 603 is a
  36. petit, bijou, chip-ette, measuring 85mm square and comprising 1.6
  37. million transistors, the 604 weighs in at 196mm square with 3.6
  38. million. This is bigger than the 601 and substantially bigger than
  39. Intel's P54C Pentium. At 8-10Watts it is also pretty power-hungry. A
  40. photo of the chip's layout reveals that one of the biggest items is the
  41. dispatch and completion unit which has to work out how to issue four
  42. instructions simultaneously and cope with out-of-order execution.
  43.  
  44. Following the path of an instruction as it wends its way through the
  45. processor gives a good feel for how the various parts interact:
  46.  
  47. We start at the 604's Fetch Unit. Its task is to grab instructions
  48. from the 16k on-board instruction cache and dump them into the eight-
  49. entry instruction queue. Under the simplest circumstances the
  50. addresses would simply be fetch sequentially, but the branch
  51. prediction unit will often kick in and offer its own suggestion of
  52. where to go next.
  53.  
  54. The 604 is the first PowerPC processor to incorporate dynamic branch
  55. prediction - its predictions adapt as time goes on and the unit
  56. records which jumps were taken previously. When the 604 finds a
  57. branch, it predicts the outcome and executes the resultant code,
  58. storing the results in a parallel set of "rename registers" until it
  59. is certain whether the prediction was correct. The chip can go two-
  60. deep in its predictions. Dynamic branch prediction is based around
  61. two structures: the Branch History Table (BHT) and the branch target
  62. address cache (BTAC). The BTAC holds the target addresses for 64
  63. branches that have been taken in the past. The BHT, by comparison is
  64. used to predict conditional branches - the 512 entries are each
  65. assigned a two-bit value indicating four levels of dynamic prediction
  66. - strongly not taken; not taken; taken and strongly-taken. Each time
  67. the branch is taken, the value is incremented. Each time it is not-
  68. taken, it is reduced.
  69.  
  70. The despatch unit is also responsible for allocating the decoded
  71. instruction to the appropriate execution unit and allocates a place
  72. in the completion unit's reorder buffer, while checking for
  73. dependencies between instructions in the dispatch queue.
  74.  
  75. We haven't room to go through a full description of all the
  76. functional units here, but both the integer and floating point units
  77. have had two-entry reservation stations added to their front end
  78. which store dispatched instructions that cannot be executed until all
  79. the source operands are supplied. These reduced stalls in the chip.
  80. The floating point unit is the first single-pass double precision
  81. unit to be incorporated into the PowerPC line. This means that both
  82. single and double precision operations take place in one clock cycle
  83. with a latency of three cycles.
  84.  
  85. Since instructions can finish out of order, the completion unit has
  86. to store executed instructions in the reorder buffer until all
  87. instructions ahead of it have been completed. Once everything is in
  88. order, the unit writes the instruction's results to the appropriate
  89. register file and updates any other resources affected. Several
  90. instructions may complete simultaneously.
  91.  
  92. THE FUTURE
  93. As we said previously, the 604 is built using the older 0.5micron
  94. technology and it doesn't incorporate the new transistor design that
  95. appeared in the 100MHz PowerPC 601; apparently Motorola doesn't have
  96. fabs which can cope with this new process yet. However this is one
  97. way in which the 604 could get smaller and faster in the future.
  98. Certainly the 100MHz clock speed is seen as being in the middle of
  99. the 604's range, so we should expect both slower and faster parts.
  100.  
  101. In addition, Ian Ferguson, Motorola Ltd's RISC product marketing
  102. engineer, suggests that the companies are looking to produce future
  103. versions of the 604 and 603 with an additional, fifth layer of metal
  104. for chip interconnects. This will make the chip between 5% and 10%
  105. smaller, he says. The shorter interconnects also have an impact on
  106. latency and therefore achievable clock speed.
  107.  
  108. In the next issue, we will be examining how critical compiler
  109. technology is to getting the best out of the PowerPC and the extent
  110. to which optimising code for one member of the PowerPC family will
  111. cause a performance hit when run on another.
  112.  
  113. Finally, for those who missed our original Powerflash with its
  114. performance comparison table, here it is again:
  115.  
  116.  
  117. =====================================================================
  118. POWERFLASH - POWERPC 604 ANNOUNCED
  119.  
  120. (April 18) As promised Motorola and IBM unveiled the PowerPC 604
  121. processor today. The 32bit processor has one floating point unit, but
  122. three integer units - two for single clock cycle instructions, the
  123. other for integer multiplication and division. The chip has estimated
  124. SPECint92 and Specfp92 ratings of 160 and 165 respectively.
  125.  
  126. The MPC604 is already sampling in small quantities to highly favoured
  127. customers, but general sampling is set to begin in the third quarter
  128. with volume production set for Q4. IBM will be manufacture the
  129. processor at its Burlington, Vermont facility and Motorola at its
  130. MOS-11 factory in Austin, Texas. No prices were given.
  131.  
  132. The processor is being manufactured in 0.5 micron CMOS, but it is
  133. worth noting that the part does not use the new, smaller transistor
  134. geometry that made its debut in the 100MHz MPC601. So expect smaller
  135. 604s in the future.
  136.  
  137. Aimed at the high-end desktop and server market, the new chip
  138. consumes between 8 Watts and 10 Watts in normal use. A 'nap' mode
  139. takes consumption down to around 400mW.
  140.  
  141. Other specifications:
  142.  
  143. *No. of transistors: 3.6 million
  144. *Die Size: 12.4mm x 15.8mm
  145. *Two separate 16k 4-way set associative instruction and data
  146.  caches.
  147. *Dynamic Branch prediction with 64-entry fully associative branch
  148.  target address cache and 512 entry branch history table.
  149. *Dispatch Unit has an 8-instruction buffer
  150.  
  151. The 604 has an onboard phase-locked loop (PLL) which allows the
  152. processor to be drive at 1x, 1.5x, 2x or 3x the bus speed. The
  153. estimated benchmark below was for a 100MHz processor being driven at
  154. 1.5x the 66MHz bus-speed.
  155.  
  156. The new performance comparison table looks like this:
  157.  
  158. +-----------------+------------+------------+
  159. |   Processor     | SPECint92  | SPECfp92   |
  160. |=================|============|============|
  161. |MPC 601   50MHz  |    51      |    6       |
  162. |          66     |    62      |   80       |
  163. |          80     |    80      |  105       |
  164. |         100     |   110      |  130       |
  165. |-----------------|------------|------------|
  166. |MPC 604  100MHz  |   160      |  165       |
  167. |-----------------|------------|------------|
  168. |MPC 603   66 MHz |    60      |   70       |
  169. |          80     |    75      |   85       |
  170. |-----------------|------------|------------|
  171. |Pentium   90 MHz |    90      |  72.7      |
  172. |         100     |   100      |  80.6      |
  173. +-----------------+------------+------------+
  174.  
  175. (c)PowerPC News -  Free by mailing: add@power.globalnews.com
  176.  
  177.